روشی برای بی نام سازی ریزداده های حجیم با حضور داده های غیرعددی، مبتنی بر عمل گر ریز تجمیع

پایان نامه
چکیده

برخی داده ها برای اهدافی چون استخراج دانش یا بهبود خدمات با دسترسی عمومی منتشر می شوند. در اثر این انتشار، حریم خصوصی صاحبان داده ها می تواند نقض شود. بنابراین داده ها باید پیش از انتشار طوری بی نام سازی شوند که ضمن سودمند ماندن برای استفاده های مجاز، حریم خصوصی صاحبان داده ها حفظ شود. یکی از روش های پُراستفاده برای این منظور ریزتجمیع است که برای تضمین k-بی نامی مناسب است. این روش در اصل برای داده های عددی طراحی شده است. در پیشینه ی پژوهش، الگوریتم های ابتکاری بسیاری برای ریزتجمیع ارائه شده است. می توان با اعمال تغییراتی در روش محاسبه ی فاصله ی میان رکوردها و روش یافتن مرکز چند رکورد، بسیاری از آن الگوریتم ها را برای داده های غیرعددی توسعه داد. تلاش هایی برای ریزتجمیع داده های دسته ای و مختلط در پژوهش های گذشته انجام گرفته است. محاسبه ی فاصله و یافتن مرکز مقادیر دسته ای با توجه به معنای آن ها، حجم محاسبات و زمان ریزتجمیع را افزایش می دهد. داده های دنیای واقعی در بسیاری از مواقع مختلط و حجیم می باشند که در این حالت مدت زمان بی نام سازی نیز علاوه بر سودمندی و حفظ حریم خصوصی، اهمیت پیدا می کند. در این پایان نامه روشی نوین به نام tbm برای ریزتجمیع داده های مختلط حجیم ارائه شده است که در مدت زمان مناسب، داده ها را برای مقادیر متفاوت k ریزتجمیع کرده به طوری که مصالحه ی خوبی میان حریم خصوصی و سودمندی ایجاد می نماید. الگوریتم tbm ابتدا برای داده های مختلط، داده های معادل عددی تولید کرده و سپس مرحله ی خوشه بندی فرآیند ریزتجمیع را بر روی داده های معادل انجام می دهد. نتیجه ی خوشه بندی به منظور تجمیع بر داده های مختلط اصلی اعمال شده و k-بی نامی به دست می آید. در این پایان نامه همچنین الگوریتم خوشه بندی مبتنی بر ترتیب به نام nfpn_imhm ارائه شده است که نسبت به روش های پیشین اتلاف اطلاعات کمتری دارد. ارزیابی ها بر روی مجموعه داده های مختلط adult نشان می دهند که به طور متوسط روش tbm نسبت به سایر روش های ریزتجمیع مختلط، مصالحه ی سودمندی-حریم خصوصی را از یک الی چهل درصد (با افزایش k) بهبود داده است. زیرا این روش از امکانات ریزتجمیع عددی برای بی نام سازی داده های مختلط استفاده نموده و خوشه بندی منسجم تری به دست می آورد.

منابع مشابه

معماری پیشنهادی مبتنی بر اینترنت اشیاء و سیستم های توصیه گر برای هوشمند سازی شهر تهران

Today, the need in many cities are complex and therefore require smart cities. The complexity on the one hand, mainly because a lot of communication between various systems such as transport, communication networks, business systems, and on the other hand, citizens who are in contact with all of these systems, is . The synchronization process fast cities with innovative technology, quickly and ...

متن کامل

ارائه روشی مبتنی بر هوش محاسباتی، برای بهبود افزایش طول عمر شبکه های حسگر بی سیم

Recent advances in wireless electronic and communications provide us the ability to build small, economical sensors with low power consumption and many diverse applications. Limited energy capacity of sensors is a huge challenge that will affect these networks. Clustering has been used as a well-known method to handle this challenge. To find appropriate location of clusters' heads, imperialist ...

متن کامل

روشی توزیع شده برای زمان‌بندی سلول در شبکه های بی سیم مبتنی بر 802.15.4e با هدف کاهش تأثیر پدیده قیفی

چکیده: استاندارد 802.15.4e برای افزایش قابلیت اطمینان به هنگام انتقال بسته­ها در زیرلایه کنترل دسترسی  و برای استفاده در شبکه­های کم‌توان و مستعد خطا نظیر شبکه­های حسگر بی­سیم ارائه شده است. امکان استفاده از کانال­های متعدد غیرهمپوشان در این استاندارد، احتمال رخداد تصادم بین فرستنده­ها را کاهش می­دهد که این نیز به­نوبه خود باعث افزایش کیفیت سرویس در شبکه و بـالاخـره کاهش مصرف انرژی می­شود. مکان...

متن کامل

تجزیۀ نامنفی ماتریسی: روشی برای تحلیل داده های نامنفی

اخیراً روش جدیدی با نام تجزیۀ نامنفی ماتریسی برای نمایش خطی داده های نامنفی پیشنهاد شده است که علاوه بر کاهش تعداد داده ها، محدودیت روش های کلاسیک را ندارد. در این روش، ماتریس بزرگِ متناظر با  داده های نامنفی به دو ماتریس نامنفی کوچک تجزیه می شود. در این مقاله، ابتدا روش های کلاسیک را مرور می کنیم. سپس تجزیۀ نامنفی ماتریسی با نسخه های مختلف آن معرفی و مسائل مهم داده کاوی مانند رده بندی و خوشه بند...

متن کامل

تشخیص گره های بدخواه در تجمیع داده مبتنی بر شایعه در شبکه های حسگر بی سیم

در این پایان نامه روشی برای حفظ صحت تجمیع داده مبتنی بر شایعه در شبکه های حسگر بی سیم توزیع شده در برابر گره های بدخواه ارائه شده است. گره های بدخواه به نوعی صحت مقدار داده مورد تجمیع در شبکه را مورد تخریب قرار می دهند. این تخریب می تواند عدم همگرایی شبکه در تجمیع داده و یا همگرایی به مقدار غلطی از داده مورد تجمیع باشد. در این راستا اصلی ترین مسئله، تشخیص گره هایی است که تحت پروتکل تعریف شده رف...

تحلیل استوار داده های فضایی در حضور داده های دورافتاده

معمولاً تابع تغییرنگار که ساختار همبستگی داده­های فضایی را تعیین می­کند و نقش پایه­ ای در تحلیل آن­ها دارد، نامعلوم است و لازم است براساس مشاهدات برآورد شود. وجود داده­ های دورافتاده در مشاهدات تاثیر نامناسبی در برآورد تغییرنگار و سایر بخش­های تحلیل داده­های فضایی همچون پیش­گویی فضایی و برآورد پارامترهای روند دارد. در این مقاله ابتدا با استفاده از برآوردگرهای مقیاس، چند برآوردگر استوار جدید با ن...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تربیت مدرس - دانشکده مهندسی برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023